我们通过失真风险度量(DRM)解决了风险敏感的增强学习(RL)环境中控制问题的问题。我们提出了策略梯度算法,该算法最大程度地提高了累积奖励的DRM,以在政策和损失的RL设置中进行情节的马尔可夫决策过程。我们采用两种不同的方法来设计政策梯度算法。在第一种方法中,我们得出了构成DRM目标的策略梯度定理的变体,并与基于可能的梯度估计方案结合使用该定理。在第二种方法中,我们从累积奖励的经验分布中估算了DRM,并使用此估计方案以及基于功能的平滑梯度估计方案。对于使用这两种方法的策略梯度算法,我们得出了非反应界限,这些界限将收敛建立到DRM目标的近似固定点。
translated by 谷歌翻译
机器学习(ML)是指根据大量数据预测有意义的输出或对复杂系统进行分类的计算机算法。 ML应用于各个领域,包括自然科学,工程,太空探索甚至游戏开发。本文的重点是在化学和生物海洋学领域使用机器学习。在预测全球固定氮水平,部分二氧化碳压力和其他化学特性时,ML的应用是一种有前途的工具。机器学习还用于生物海洋学领域,可从各种图像(即显微镜,流车和视频记录器),光谱仪和其他信号处理技术中检测浮游形式。此外,ML使用其声学成功地对哺乳动物进行了分类,在特定的环境中检测到濒临灭绝的哺乳动物和鱼类。最重要的是,使用环境数据,ML被证明是预测缺氧条件和有害藻华事件的有效方法,这是对环境监测的重要测量。此外,机器学习被用来为各种物种构建许多对其他研究人员有用的数据库,而创建新算法将帮助海洋研究界更好地理解海洋的化学和生物学。
translated by 谷歌翻译
文献中有许多不同的方法来解释机器学习结果。但是,这些方法的方法有所不同,通常没有提供相同的解释。在本文中,我们考虑了两种最新方法:集成梯度(Sundararajan,Taly和Yan,2017年)和基线Shapley(Sundararajan和Najmi,2020年)。原始作者已经研究了两种方法的公理属性,并提供了一些比较。我们的工作为表格数据提供了一些有关其比较行为的其他见解。我们讨论两者提供相同解释及其不同的常见情况。我们还使用仿真研究来检查具有Relu激活函数的神经网络拟合模型时的差异。
translated by 谷歌翻译
在机器学习(ML)社区中,低阶功能方差分析(FAROVA)模型以固有的可解释的机器学习为幌子。可解释的提升机或EBM(Lou等人,2013年)和Gami-Net(Yang等,2021)是最近提出的两种用于拟合功能性主要效应和二阶相互作用的ML算法。我们提出了一种称为Gami-Tree的新算法,类似于EBM,但具有许多可带来更好性能的功能。它使用基于模型的树作为基础学习者,并结合了一种新的交互过滤方法,可以更好地捕获基础交互。此外,我们的迭代训练方法会收敛到具有更好的预测性能的模型,并且嵌入式纯化确保相互作用在层次上是正交的,与主要效应是正交的。该算法不需要广泛的调整,我们的实施是快速有效的。我们使用模拟和真实数据集比较Gami-Tree与EBM和GAMI-NET的性能和解释性。
translated by 谷歌翻译
大多数机器学习(ML)算法具有多个随机元素,并且它们的性能受这些随机性来源的影响。本文使用一项经验研究来系统地检查两个来源的效果:模型训练中的随机性和在数据集分配到训练和测试子集中的随机性中。我们量化和比较以下ML算法的预测性能变化的幅度:随机森林(RFS),梯度增强机(GBMS)和前馈神经网络(FFNNS)。在不同的算法中,与基于树的方法相比,模型训练中的随机性会导致FFNN的变化更大。这是可以预期的,因为FFNN具有更多的随机元素,这些元素是其模型初始化和训练的一部分。我们还发现,与模型训练的固有随机性相比,数据集的随机分裂会导致更高的变化。如果原始数据集具有相当大的异质性,则数据拆分的变化可能是一个主要问题。关键字:模型培训,可重复性,变化
translated by 谷歌翻译
筛查结肠镜检查是多种3D计算机视觉技术的重要临床应用,包括深度估计,表面重建和缺失区域检测。但是,由于难以获取地面真相数据,因此在实际结肠镜检查视频中对这些技术的开发,评估和比较仍然在很大程度上是定性的。在这项工作中,我们提出了一个带有高清临床结肠镜和高保真结肠模型的结肠镜检查3D视频数据集(C3VD),用于在结肠镜检查中进行基准计算机视觉方法。我们介绍了一种新颖的多模式2D-3D注册技术,以注册光学视频序列,并以地面真实的视图对已知3D模型的视图。通过将光学图像转换为具有生成对抗网络的深度图,并通过进化优化器对齐边缘特征来注册不同的模态。在模拟实验中,这种注册方法达到了0.321毫米的平均翻译误差,平均旋转误差为0.159度,无误地面真相可用。该方法还利用视频信息,将注册精度提高了55.6%以进行翻译,与单帧注册相比,旋转60.4%。 22个简短的视频序列被注册,以生成10,015个总帧,具有配对的地面真实深度,表面正常,光流,遮挡,六个自由度姿势,覆盖范围图和3D模型。该数据集还包括胃肠病学家与配对地面真相姿势和3D表面模型获得的筛选视频。数据集和注册源代码可在urr.jhu.edu/c3vd上获得。
translated by 谷歌翻译
近几十年来,气候变化显着影响冰川动态,导致质量损失和冰川相关危害的风险增加,包括冰川上和冰期湖上的湖泊发展以及灾难性的爆发洪水。快速变化的条件决定了对气候 - 冰川动力学的连续和详细观察的需求。有关冰川几何形状的主题和定量信息对于理解气候强迫和冰川对气候变化的敏感性的敏感性至关重要,但是,基于光谱信息和常规机器学习技术的使用,基于使用光谱信息和常规的机器学习技术,众所周知,准确地绘制碎片冰川冰川(DCG)。这项研究的目的是改善较早提出的基于深度学习的方法Glaciernet,该方法旨在利用卷积神经网络分割模型来准确地概述区域DCG消融区。具体而言,我们开发了一种增强的冰川架构,使多个模型,自动后处理和盆地级水文流技术来改善DCG的映射,从而包括消融区和积累区域。实验评估表明,GlacierNet2改善了消融区的估计,并允许高水平的交点比联合(IOU:0.8839)得分。所提出的体系结构在区域尺度上概述了完整的冰川(累积和消融区),总体评分为0.8619。这是自动化完整冰川映射的至关重要的第一步,可用于准确的冰川建模或质量平衡分析。
translated by 谷歌翻译